📚測りすぎなぜパフォーマンス評価は失敗するのか？

20250406

20250510 『測りすぎなぜパフォーマンス評価は失敗するのか？』（ジェリー・Z・ミュラー）

table:infobox

抜書き 📚測りすぎについて書いている行

はじめに

測定自体が悪いわけではないが、測定は意図せぬ好ましくない結果をもたらし得る。

過剰な測定や不適切な測定。

測定基準への執着が問題。

本書でなされること。

説明責任基準という美徳は貴重なツールにはなり得るが誇大宣伝されており、代償は過小評価されていると主張。

測定基準への執着をどうすれば避けられるか、痛みを軽減できるかの診断。

実績を測定するという行為には落とし穴がたくさんあるが、それでも本質的に望ましいもの。

客観性が有益な場合も多い。

が、測定基準が成果や格付けの判断基準になると問題が生じがち。

Part Ⅰ 議論

1 簡単な要旨

測定執着の要素

個人的経験と才能に基づいて行われる判断を、標準化されたデータに基づく相対的実績という数値指標に置き換えるのが可能であり、望ましいという信念

そのような測定基準を公開することで、組織が実際にその目的を達成していると保証できるのだという信念

それらの組織に属する人々への最善の動機づけは、測定実績に報酬や懲罰を紐づけることであり、報酬は金銭または評判であるという信念

測定執着とは、測定が実践されたときに意図せぬ好ましくない結果が生じてても上記の信念が持続している状態。

測定されるものに注目が集まり、それ以外が蔑ろにされる→それに気づくと、測定する指標が増やされる→ますますデータが役ただなくなり、データ集める時間も膨らむ→仕事が有害な形に変わり、仕事への士気が低下する→実績指標を操作するようになり、組織が機能障害を起こす。

能力給は、汚職や改ざん、腐敗につながりがち。かつ、数値目標によりイノベーションと独創性を抑え込んでしまい、長期目標よりも短期目標が重視されるようになる。実際に進捗がないのに測定の進捗が達成感を生むことも。

と書いているものの、測定の有害さを主張したいのではない。本書の目標のひとつは、実績基準が純粋に有益な場合を特定すること。

2 繰り返す欠陥

情報の歪曲問題

一番簡単に測定できるものしか測定しない（求められる成果が複雑なものなのに、簡単なものしか測定しない）

成果ではなくインプットを測定する

標準化によって情報の質を落とす

測定基準の改竄

上澄みすくいによる改竄

基準を下げることで数字を改善する

データを抜いたり、ゆがめたりして数字を改善する

不正行為

Part Ⅱ 背景

3 測定および能力給の成り立ち

正確に測定できるものが、重要なものを見劣りさせる。

測定執着の一つの方向性は、標準化された、数値化されたもっと多くのデータを要求する。

4 なぜ測定基準がこれほど人気になったのか

測定の説明責任は欠点があるのに、どうしてこれほど人気なのか？

能力主義社会では、安定感がないがために客観的（に見える）判断を求める可能性が高い。で、数字は客観性があるような感じを出せるから。

不信感のある対象に対して、数字を持ち出して述べることで、透明性と客観性の印象を与えられるから。

測定基準が重視されると、測定のない判断に対する信頼は低下し、さらに測定基準が重視され、、という悪循環が起こる。そして裁量を発揮できない状況になり、過剰規制につながる。

アメリカでは責任範囲の拡大が起こった結果、訴訟されるリスクが増え、客観的な基準がより重要になっていった。

成功や失敗を測る手段がないという信念が、客観的な測定を要請する。この公的機関に要請された構図が、専門職へもおよぶ。

専門職への疑念を抱くようになれば、客観的な指標が求められるようにもなり、多くの測定が導入されていく。

医療と教育はコスト高が続き、それが効率と説明責任を求めるプレッシャーを生んだ。これらの分野においては、測定すること自体が難しいのに、その事実は無視されて。

組織が複雑化する→すべてを理解するのは不可能になる→測定基準により判断に用いる材料を限定できるので、魅力的な手段として使われる。

複雑な組織把握するために報告を要求し、意思決定の手順が増え、それに多大な時間が使われるように。

管理職に就くものの組織に対する知識が少ないと、より測定基準が求められたり。

ITの発展も無視できない要因。

データを集めることと集計することのコストが減った結果、データこそが答えで、集めることで改善が見込めるかもしれないという信念を生んだ。

5 プリンシパル、エージェント、動機づけ

株主の関心である会社の収益と、経営者や被雇用者の関心はズレている。同一ではない場合がある。それらを一致させたり、被雇用者が株主の望む収益を上げることに向かうような報酬体系や評価制度を考える必要性が出てくる。

様々な企業や組織に伝播し、一致していると考えられる市場の仕組みのようなものを組織に実装しよう、もっとビジネスらしくしようと、三つの戦略を考えた。

測定による評価指標

測定実測による報酬・懲罰制度

実績指標の透明化

これによって互いに競わせ、市場のような状態を目指した。

営利企業ならまだしも、非営利企業には適さないと考えられる。

志や組織への献身を無視するような報酬制度といえる。

外的報酬を求めるという単純な考え方。

志などは内的報酬。

有効な場合もあるが、破壊的であるほど逆効果の場合も。

6 哲学的批判

知識の二つの形。

抽象的で定式化されたもの

体系化、伝達・応用可能。

実践的で暗黙に了解されるもの

一般化された定式で伝達できない。

合理主義、科学主義は、過度に抽象的で定式化された知識を重んじる。

それによりすべて理解できる、と。

測定執着と結びつく。過度に測定可能な知識に偏ることで、かえって不合理に。

起業家精神も損なわせる。

探求と独創性には、測定不能なリスクに挑むことが不可欠。

測定可能なリスクのみで評価されることで、測定不能なリスクを取らなくなってしまうから。

判断には総合的な力が必要。全体を把握し、個別の状況を理解するような。

それは、数値測定では得られない。

Part Ⅲ あらゆるものの誤測定？

7 大学

入学者を増やすことを目標に→学位を取るレベルに満たない生徒の増加→大学側の対応で学位が取れる生徒に皺寄せらかつ高ランク大学への志願者増加・競争の激化へ。

大学進学者が増加→政府支出が伴うため、成果を測定する機関が増加→大学側の事務仕事が増え、それを、処理する専門職に費用が使われるように。

論文の発表数でランキングをつければ、質より量の論文発表になる。引用数で測れば、引用件数を引き上げるための不正が行われる。

影響力を集計したければ、そういう指標を使うことなく、読んで専門家が判断すること。読むことなくして測ることはできない。

大学スコアカードにより評価されるようになったが、簡単に言えば金銭的な「投資利益率」にのみ焦点が当てられた測定基準。

高ランキングの大学は生徒を高収入を得られる職業に送り込む。

優秀な生徒にそのキャリアを薦めるのは、国家にとって最善か？

曲がり切った定規で測るのと同じ。

8 学校

共通テストが悪いわけではなく、生徒の能力と進歩を測ることができる。問題は、その重要度が増すと、テストに注力するというインセンティブが働いてしまうこと。重要度が低い時にのみ有用。

9 医療

グラーヴランド・クリニック、ガイシンガー・ヘルス・システム、キーストン・プロジェクトの成功。

測定基準が、それより大きな組織文化に組み入れられていた。

組織文化の中に、必要であるから測定基準が設けられている。

文化の中に、が大事なポイント。

内的動機による組織駆動に。

組織文化外の設けた基準は、かなり違う形のインセンティブ構造を生むことに。

測定結果の効果が不足している、あるいは極めて限定的である。

測定結果の公表により、何が重要かよりも何が測定できるかに注目してしまい、測定により目標がズレる。あるいは測定が目的になってしまう。

測定で悪い結果を出したくないので、リスクをとらず回避する傾向に。

過剰な治療がおこなわれ、手術が失敗したときに無理に延命されたり。

測定結果の公表のメリットとしては、能力の低い外科医を炙り出す可能性があること。

デメリットに対してメリットは限定的。

10 警察

凶悪な犯罪を測定指標とすると、それを減らしたいとその街の政治家は警察に圧力をかけ（犯罪率が自身の当選に影響するため）警察署長は警察官に凶悪犯罪の報告の減少させるようプレッシャーをかけ、それが現場からの報告の改竄につながる。

軽微な犯罪に読み替えられる。

11 軍

有用な測定基準には、現地の状況の熟知と、現場についての深い知識が必要。

測定基準によって説明責任を果たすのには、矛盾が生じる。

組織というものは複雑、であるがゆえに、標準化された測定基準は不正確かつ欺瞞的にならざるを得ない。

一方で、説明責任を果たすのに必要な測定は、標準化されたもの。

12 ビジネスと金融

能力給が効果がある場合（ほとんどの企業にはそぐわない）

反復的で非創造的な仕事である

標準化された商品の生産や販売である

判断を求められることが少ない

仕事に内的満足感があまりない

個人の努力に基づいて測定できる

助言を与え指導したりという行為が仕事の中で重要な位置を占めていない

企業の機能不全の大部分は、たった一つの効果を測定するために狭義に設定された能力給の枠組み。

法律により測定が義務化され、そのために本来の仕事が追いやられてしまい、最後には測定できることだけがおこなわれようなことに。

短期的目標の達成のために、長期的な用途のリソースを奪う。

13 慈善事業と対外援助

簡単なものを測定したがる。簡単に測れる数値を。

補説

14 透明性が実績の敵になるとき政治、外交、防諜、結婚

不透明より透明な方が良い、という考え方が測定基準の魅力の大部分を占める。が、実績と透明性は一緒に上がったり下がったりするわけではない。

例えば、親密な関係が築けるのは、全てを知らないから。何を考えているかわからない部分があるから。

政治と政府でも、アウトプットには透明性が必要であっても、インプットは不透明なままの方がいいことも。

外交と諜報活動でも、機密であることが担保されないとすると、情報提供ができなくなる。

透明性がパフォーマンスの敵となることがあるということ。

Part Ⅳ 結論

15 意図せぬ、だが予測可能な悪影響

教訓

測定されるものに労力を割くことで、目標がずれる

短期主義の促進

従業員の時間と労力の浪費

やがてコストが効用を上回る

改竄や不正を防ぐための規則だらけ

運に報酬を与える

リスクを取る勇気とイノベーションの阻害

個人に報酬を与えることによる協力と共通の目標の阻害

仕事の劣化

16 いつどうやって測定基準を用いるべきか

ただ実績を測定することには有害なことはない。成功と失敗を定量化したり、測定結果に評価が与えられるときに、有害化する。

測定は、判断を要する。

測定すべきかどうか

何を測定するのか

測定に報酬や懲罰を紐づけるべきかどうか

測定結果を公表すべきかどうか

チェックリスト

1. どういう種類の情報を測定しようと思っているのか？

人間は測定に反応するので、測定の信頼は低下する。かつ、報酬や懲罰はさらに正当性をねじ曲げる方向に反応する可能性が高くなる。

2. 情報はどのくらい有益なのか？

3. 測定を増やすことはどれほど有益か？

測定が役立つからといって、測定を増やすことがもっと役にたつとは限らない。

測定にはコストがかかりるので、メリットを上回るかも。

4. 実績についてほかの情報源があるか？

5. 測定した情報は誰に公開されるのか？

作業を行う当人が内部監視のために行うのか、第三者が評価するために使うのかを区別する。前者は、作業を行うものが測定が分析等に有用であると思っていれば成功する。後者は歪めやすい。

6. 測定実績を得る際にかかるコストは？

7. 組織のトップがなぜ実績測定を求めているのかきいてみる。

現場の知識がある上で考えられたものか。

8. 実績の測定方法は、誰が、どのようにして開発したのか？

上からの押し付けであれば、歪む。効果的になりにくい。現場が求めている、もしくは現場の意見を取り入れた場合に限り、有用になりうる。現場が測定の価値を認めていなければ意味がない。

9. もっともすぐれた測定でさえ、汚職や目標のずれを生む恐れがあることを覚えておく。

10. 時には、何が可能かの限界を認識することが、叡智の始まりとなる場合もある。

測定基準を、判断のもととなる情報源としてとらえる。